首页> 外文OA文献 >Temporal Extension of Scale Pyramid and Spatial Pyramid Matching for Action Recognition
【2h】

Temporal Extension of Scale Pyramid and Spatial Pyramid Matching for Action Recognition

机译:尺度金字塔的时间扩展与空间金字塔匹配   行动认可

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Historically, researchers in the field have spent a great deal of effort tocreate image representations that have scale invariance and retain spatiallocation information. This paper proposes to encode equivalent temporalcharacteristics in video representations for action recognition. To achievetemporal scale invariance, we develop a method called temporal scale pyramid(TSP). To encode temporal information, we present and compare two methodscalled temporal extension descriptor (TED) and temporal division pyramid (TDP). Our purpose is to suggest solutions for matching complex actions that havelarge variation in velocity and appearance, which is missing from most currentaction representations. The experimental results on four benchmark datasets,UCF50, HMDB51, Hollywood2 and Olympic Sports, support our approach andsignificantly outperform state-of-the-art methods. Most noticeably, we achieve65.0% mean accuracy and 68.2% mean average precision on the challenging HMDB51and Hollywood2 datasets which constitutes an absolute improvement over thestate-of-the-art by 7.8% and 3.9%, respectively.
机译:历史上,该领域的研究人员花费了大量精力来创建具有比例不变性并保留空间定位信息的图像表示。本文提出对视频表示中的等效时间特性进行编码,以进行动作识别。为了实现时间尺度不变性,我们开发了一种称为时间尺度金字塔(TSP)的方法。为了对时间信息进行编码,我们提出并比较了两种方法,即时间扩展描述符(TED)和时分金字塔(TDP)。我们的目的是为匹配速度和外观变化较大的复杂动作提供解决方案,这在大多数当前动作表示中都是缺失的。在四个基准数据集(UCF50,HMDB51,Hollywood2和Olympic Sports)上的实验结果支持了我们的方法,并且明显优于最新方法。最引人注目的是,我们在具有挑战性的HMDB51和Hollywood2数据集上实现了65.0%的平均准确度和68.2%的平均平均准确度,分别比最先进的数据集提高了7.8%和3.9%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号